AI 编程的典型翻车 (;¬д¬)
"任务完成了"
明确要求的功能被跳过 (╯°□°)╯
更隐蔽的坑 (´・ω・`)
看起来能跑
修 bug 花 几倍时间 (´;ω;`)
坏写法传染 Σ(っ°Д°;)っ
1 → N 扩散
修复成本指数增长
注意到一个现状 —— (`・ω・´)
同等模型越来越多,体验差距反而拉大
2023
GPT-4
Claude
Gemini
2025
Now
大
小
体验差距
差距在拉大!
比如编程场景 —— 同一个模型,不同产品
为什么? (。ŏ_ŏ)
因为模型是一样的 (`・ω・´)
同一模型
GPT-4 / Claude
Bug一堆
产品 A
生产级
产品 B
差距在 怎么用模型 (。・ω・。)
HARNESS
更准确的说法 —— 让模型 (。・ω・。)ノ
地工作 ✧*。٩(ˊᗜˋ*)و✧*。
这就是我们今天要讲的 (`・ω・´)ゞ
Harness Engineering
驾 驭 工 程